Global Average Pooling
例えばVGG-16を考えてみると,
最後の全結合って計算量やばいよね
VGG-16だと, $ 7 \times 7 \times 512 → 1 \times 1 \times 4096 で全結合
パラメタ数は$ (7 \times 7 \times 512) \times (1 \times 1 \times 4096) → エグい
チャネル方向に平均をとって, そいつらをconcatしてあげればOKじゃない?
→ Global Average Pooling
性能は普通にflattenした場合とさほど変わらないらしい
https://gyazo.com/ef3b1a4a7aa264b5d87a31c9781ff80b
https://gyazo.com/e6fd87d1e1e3b897becb3c088408449a